期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于最大化依赖的恐怖行为背景特征提取方法
薛安荣, 贾小艳, 葛清龙, 杨晓琴
计算机应用    2015, 35 (3): 797-801.   DOI: 10.11772/j.issn.1001-9081.2015.03.797
摘要458)      PDF (835KB)(409)    收藏

针对恐怖数据集中存在的属性值残缺问题,提出了基于最大化背景向量与行为之间依赖关系的压缩背景空间(CCS)方法。该方法基于希尔伯特-施密特独立标准和希尔伯特-施密特范数,它们能有效检测变量间的关联性。CCS通过使得背景向量线性投影后的低维特征与行为之间希尔伯特-施密特范数最大化,从而实现背景向量与行为之间的依赖关系最大化,更好地发现两者之间的关联性,减小属性值残缺带来的影响。然后利用分类模型(如支持向量机(SVM))对所得到的低维特征进行学习(CCS+SVM),实现高效预测。在MAROB数据集上的实验表明:与SVM模型、基于传统特征提取方法(如PCA和CCA)的SVM模型以及已有的恐怖行为预测算法CONVEX相比,CCS+SVM的性能在查全率和F值上分别提高1.5%和1.0%以上,而查准率和ROC曲线下面积(AUC)值与最好性能相当。实验结果表明,CCS+SVM能够较好地解决恐怖数据集中的属性值残缺问题。

参考文献 | 相关文章 | 多维度评价
2. 基于小波变换的分布式隐私保护聚类算法
薛安荣 刘彬 闻丹丹
计算机应用    2014, 34 (4): 1029-1033.   DOI: 10.11772/j.issn.1001-9081.2014.04.1029
摘要424)      PDF (783KB)(404)    收藏

针对现有隐私保护聚类算法无法满足效率与隐私之间较好折中的问题,提出一种基于安全多方计算(SMC)与数据扰动相结合的分布式隐私保护聚类算法。各数据方用小波变换实现数据压缩和信息隐藏,并用属性列的随机重排来防止数据重构可能产生的信息泄露。该算法仅使用压缩重排后的数据参与分布聚类计算,因此计算量和通信量小,算法效率高,而多重保护措施有效保护了隐私数据。因小波变换具有高保真性,所以聚类精度受小波变换的影响较小。理论分析和实验结果表明,所提算法安全高效,在处理高维数据时全局F测量值和执行效率优于基于Haar小波的离散余弦变换(DCT-H)算法,解决了效率与隐私之间的折中问题。

参考文献 | 相关文章 | 多维度评价
3. 加速大规模数据集的离群点检测
薛安荣 闻丹丹 刘彬
计算机应用    2013, 33 (11): 3057-3061.  
摘要764)      PDF (779KB)(326)    收藏
针对现有基于距离的离群点检测算法在处理大规模数据时效率低的问题,提出一种基于聚类和索引的分布式离群点检测(DODCI) 算法。首先利用聚类方法将大数据集划分成簇;然后在分布式环境中的各节点处并行创建各个簇的索引;最后使用两个优化策略和两条剪枝规则以循环的方式在各节点处进行离群点检测。在合成数据集和整理后的KDD CUP数据集上的实验结果显示,在数据量较大时该算法比Orca和iDOoR算法快近一个数量级。理论和实验分析表明,该算法可以有效提高大规模数据中离群点的检测效率。
相关文章 | 多维度评价
4. 基于最小生成树的非均匀分簇路由算法
张明才 薛安荣 王伟
计算机应用    2012, 32 (03): 787-790.   DOI: 10.3724/SP.J.1087.2012.00787
摘要1050)      PDF (712KB)(663)    收藏
发现现有的针对非均匀分簇路由算法没有充分考虑簇首与基站之间最优路径选择,而导致传输路径上的能量消耗不均衡的问题。为了更好地均衡传输路径上节点能量的消耗,提出了基于最小生成树的非均匀分簇的路由算法。该算法利用节点剩余能量和节点到基站的距离选举簇首,然后通过建立最小生成树搜寻最优传输路径,这样可以减少传输路径上的能量消耗,有效地解决能耗不均衡问题。理论分析和实验结果均表明,该算法无论在存活节点个数还是在能量消耗上都明显优于EEUC算法和EBCA。
参考文献 | 相关文章 | 多维度评价